凸集
仿射集合和凸集
仿射集合
- 仿射集合p20
- 仿射组合
- 仿射包p20
- 仿射维数p21
- 集合C的仿射维数为仿射包的维数
- 定义集合C的相对内部为它相对于仿射包的内部,记做relintC
- 可根据仿射维数定义相对边界为clC/relintC,此时clC为C的闭包
凸集
- 对任意x1,x2∈C,和满足0≤θ≤1都有:
- θx1+(1−θ)x2∈C
- 直观理解,集合中的每一点都可以被其他点沿着他们之间一条无阻碍的路径看见,那么这个集合就是凸集。
- 可类似定义凸组合
- 一个集合是凸集等价于集合包含所有点的凸组合
- 点的凸组合可以看做是混合或加权平均
- 凸包
锥
- 对于任意x∈C和θ≥0都有θx∈C,则称集合C为锥或者非负齐次。
- 在二维上为扇形,注意,锥一定包含原点
- 可类似定义锥组合
- 锥包p23
- 集合C中所有点的锥组合的集合为锥包,是包含C的最小凸锥
例子
- 空集、单点集合、全空间都是仿射的。
- 一条射线是凸的,但不是仿射的。
- 若射线的基点是原点,则为凸锥。
- 任意直线是仿射的,如果直线过原点,则为子空间(也是凸锥)。
超平面与半空间
- 可看成法线方向为a的超平面,而常数b则决定了这个平面从原点的偏移
- {x∣aTx=b}
- 超平面由所有正交于法向量a的向量+偏移x0组成。
- {x∣aT(x−x0)=0}
- 一个超平面将Rn分为两个半空间p24
多面体
半正定锥
- 我们用S+n表示对称半正定矩阵的集合:
- S+n={X∈Sn∣X⪰0}
- 同样也可以表示对称正定集合S++n
- 很容易得到验证,集合S+n是一个凸锥。
- xT(θ1A+θ2B)x=θ1xTAx+θ2xTBx≥0
保凸运算
- 除了介绍一些凸集之外,我们需要一些运算,这些运算能帮助我们构造更多的凸集。
交集
- 交集运算时保凸的
- 例如,每一个闭集是包含它的所有半空间的交集p32。
仿射函数p33
- 仿射函数具有如下形式;即为一个线性函数和常数的和:
- f(x)=Ax+b
- 因此,伸缩和平移是保凸的;
- 一个凸集向它的几个坐标的投影是凸的(投影矩阵);
- 笛卡尔积也是保凸的;
- 凸集的部分和也是凸的;
线性分式和透视函数
透视函数
- 定义P:Rn+1→Rn,P(z,t)=z/t为透视函数
- 透视函数对向量进行伸缩(规范化),使得最后一维分量为1并舍弃
- 一个凸集在透视函数下的原象也是凸的
- 可以通过小孔成像的例子来解释p35
线性分式
- 线性分式函数由透视函数和仿射函数复合而成:
- g(x)=(Ax+b,cTx+d)
- f(x)=(Ax+b)/(cTx+d)
- 其中g(x)为仿射函数,P为透视函数,f=P⊙g为线性分式函数
广义不等式
正常锥p38
- 我们定义K为正常锥,如果它满足:
- K是凸的
- K是闭的
- K是实的,即具有非空内部
- K是尖的,即不包含直线
- 可以使用正常锥来定义广义不等式,即为Rn上的偏序关系
- x⪯Ky⇔y−k∈K
- x≺Ky⇔y−k∈int(K)
- 广义不等式满足一般不等式的很多性质p39,但并不是一个线性序,也就是说,两点不一定能比
最小元和极小元
- 一个集合可能有多个极大元和极小元p40
- 不一定有最小元,极小元定义为:
- (x−K)⋂S={x}
- (x−K)表示可以与x相比并且小于等于x的所有元素
分离与支撑超平面
超平面分离定理p42
- 两个不相交的凸集,一定存在一个超平面能将其分开p42。
- 设存在c∈C,d∈D使得两个集合的距离最小,则:
- f(x)=(d−c)T(x−(1/2)(d+c))
- 若在两个凸集中有aTx<b,aTx>b,则能够严格分离。
支撑超平面
- 若x0是边界上的一点,对于任意x都满足aTx≤aTx0,则超平面{x∣aTx=aTx0}为集合C在点x0处的支撑超平面。
- 支撑超平面定理p46:
- 对任意非空凸集和任意x0,都存在支撑超平面
- 如果一个集合是闭的,具有非空内部,并且其边界上每个点均存在支撑超平面,则它是凸的。
对偶锥和广义不等式
- 定义K的对偶锥为:
- K⋆={y∣xTy≥0,∀x∈K}
- 如论K是否为凸锥,对偶锥K⋆一定是凸的。
- 我们之前根据正常锥定义了广义不等式和最小元,因此也可以对对偶锥定义同样的性质。
广义不等式的对偶
有两条重要性质,将广义不等式和对偶联系起来p48
- x⪯Ky当且仅当对于任意λ⪰K⋆0,有λTx⪯λTy
- x≺Ky当且仅当对于任意λ⪰K⋆0和λ≠0,有λTx≺λTy
凸函数
基本性质
若domf为为凸集,且对于任意x,y∈domf和任意0≤θ≤1,有:
f(θx+(1−θ)y)≤θf(x)+(1−θ)f(y)
则f是凸函数。
仿射函数既凸又凹。
若f为凸函数,则对于x∈domf和任意v,都有g(t)=f(x+tv)是凸的。这个性质非常有用:
函数是凸的,当且仅当在其定义域相交的任何直线上都是凸的。
扩展值延伸
将凸函数在定义域外的值令为∞,从而将这个凸函数延伸至全空间。
将延伸后的函数记为f~,因此可得:
f~(θx+(1−θ)y)≤θf~(x)+(1−θ)f~(y)
一阶条件
假设f可微,则函数是凸函数的充要条件是对于任意x,y∈domf,都有:
f(y)≥f(x)+▽f(x)T(y−x)
其一阶Taylor近似是原函数的一个全局下估计。
不等式从一个凸函数的局部信息可以得到全局信息,这可以得到凸优化问题的一些非常重要的信息:
例如,当▽f(x)=0时,我们可以知道x是函数f 的全局极小点。
二阶条件
f是凸函数的充要条件是其Hessian矩阵
是半正定的。
对于R上的函数,可以简化为f′′(x)≥0,可以理解为函数图像在点x处有正向上的曲率。
注意,在判断函数凸性之前,其定义域是凸集这个前提条件必须满足。
例子p65
- 指数函数(eax)
- 幂函数(xa)
- 绝对值幂函数(当p≥1时,∣x∣p为凸函数)
- 对数函数(logx)为凹函数
- 负熵(xlogx)
- 范数
- 最大值函数
- 二次-线性分式函数(f(x,y)=x2/y)
- 几何平均是凹函数
- f(x)=(i=1∏nxi)1/n
- 对数行列式是凹函数
- f(x)=logdetX
下水平集p69
函数f的α−下水平集为:
Cα={x∈domf∣f(x)≤α}
对于任意α,凸函数的下水平集依然为凸函数。
但反过来不一定成立:某个函数的所有下水平集都是凸集,但这个函数可能不是凸函数。
如果f为凹函数,则α−上水平集也是凸集。
上镜图
函数f的上镜图定义为:
epif={(x,t)∣x∈domf,f(x)≤t}
一个函数是凸函数,当且仅当其上镜图是凸集。
一个函数是凹函数,当且仅当其亚图是凹集:
hypof={(x,t)∣t≤f(x)}
Jensen不等式p71
若函数f是凸函数,x1,...,xk∈domf,θ1,...,θk≥0且和为1,则下式成立:
f(θ1x1+...+θkxk)≤θ1f(x1)+...+θkf(xk)
保凸运算p73
以下运算后的函数依然为凸函数:
- 非负加权求和
- 复合仿射变换
逐点最大和逐点上确界
- 几乎所有凸函数都可以表示为一簇仿射函数的逐点上确界p77
- 标量(矢量)复合运算
- 最小化函数
- 透视函数(g(x,t)=tf(x/t))
共轭函数p85
f⋆(y)=x∈domfsup(yTx−f(x))
此函数称为f的共轭函数;即差值yTx−f(x)在domf所有上界构成了共轭函数的定义域
因为共轭函数是一系列仿射函数的逐点下确界,则f⋆为凸函数。
重点掌握以下凸函数的共轭函数:
- 负对数函数
- 负熵函数f(x)=xlogx
- 严格凸的二次函数f(x)=21xTQx
- 其共轭函数为f⋆(y)=21yTQ−1y
- 对数行列式
- 其共轭函数为f⋆(Y)=logdet(−Y)−1−n
Fenchel不等式p89
从共轭函数的定义可以得到,对于任意的x和y,有下列不等式成立:
f(x)+f∗(y)≥xTy
拟凸函数p90
函数f称为拟凸函数,如果其定义域与及所有下水平集都是凸集:
Sα={x∈domf∣f(x)≤α}
同样的,若−f是拟凸函数,即所有上水平集都是凸集,则f为拟凹函数。
拟凸函数的函数图像最多只有一个“峰”,因此也被称为单峰函数。
拟凸函数可能是凹函数,也有可能是不连续的。
基本性质
函数f是拟凸函数的充要条件为:
对于任意x,y∈domf,且0≤θ≤1有:
f(θx+(1−θ)y)≤max{f(x),f(y)}
即线段中的任何一点都不超过其端点函数值最大的那一个。
保拟凸运算p95
- 非负加权最大
- 复合运算
- 最小化
对数-凸函数p98
如果对于所有的x∈domf都有f(x)>0且logf是凸函数,则函数f是对数-凸函数。
可以不使用对数来进行表达:
若对于任意x,y∈domf,0≤θ≤1,有:
f(θx+(1−θy))≥f(x)θ+f(y)1−θ
则函数为对数-凸的。
可以根据函数复合来得到对数-凸函数:
如果函数是凸函数,则ef也是凸函数。
因此,对数-凸函数是凸函数。
例子
- 仿射函数
- 幂函数
- 指数函数
- Gamma函数